Model Selection

Large-scale visual feature extraction

# Large-scale visual feature extraction

Vit Huge Patch14 Clip Quickgelu 378.dfn5b

ViT-Huge image encoder based on CLIP architecture, trained on DFN5B dataset, supports quick GELU activation

Image Classification

Vit Huge Patch14 Clip 378.dfn5b

The visual encoder component of DFN5B-CLIP, based on ViT-Huge architecture, trained with 378x378 resolution images for CLIP model

Image Classification

Convnext Xxlarge.clip Laion2b Soup

ConvNeXt-XXLarge image encoder based on the CLIP framework, trained by LAION, suitable for multimodal tasks

Image Classification

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase